import pyarrow as pa
import pyarrow.parquet as pq

import pandas as pd

'''
# 创建一个简单的数据表
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['New York', 'San Francisco', 'Los Angeles']
}
df = pd.DataFrame(data)

# 转换为 Arrow 表
table = pa.Table.from_pandas(df)

# 写入 Parquet 文件
pq.write_table(table, 'output.parquet')

'''

# 读取 Parquet 文件
table = pq.read_table('output.parquet')

# 将表格转换为 Pandas DataFrame

df = table.to_pandas()

# 显示数据
print(df.head())

